نتایج جستجو برای: یادگیری تقویتی

تعداد نتایج: 20110  

ژورنال: کنترل 2017

افزایش روزافزون تعداد خودروها و در پی آن ترافیک‌های سنگین شهری چالش بزرگی را برای کنترل بهینه ترافیک شهری برای مهندسین ایجاد کرده است. روش مناسب برای کنترل بهینه ترافیک هرچه باشد یقیناً باید وفق پذیر بوده تا بتواند ترافیک شهری را که دارای طبیعت پویا، پیچیده و تغییرپذیر است را به‌خوبی مدیریت نماید. در این راستا تمرکز اصلی تحقیق حاضر کنترل هوشمند و توزیع یافته چراغ‌های راهنمایی بر پایه یادگیری تقو...

ژورنال: :کنترل 0
زهرا حسن زاده بنابیدی zahra hasanzadeh binabidi گروه مهندسی پزشکی، دانشگاه آزاد اسلامی، واحد مشهد حمیدرضا کبروی hamidreza kobravi گروه مهندسی پزشکی، دانشگاه آزاد اسلامی، واحد مشهد سعید طوسی زاده saeed toosizadeh گروه مهندسی برق، دانشگاه آزاد اسلامی، واحد مشهد رضا بوستانی reza boostani گروه مغز و اعصاب، دانشگاه علوم پزشکی مشهد

توانبخشی حرکتی از مباحث مورد توجه محققان است. در اینتحقیق، یک راهکار کنترلی به منظور کنترل حرکت مدلی از بازوی دست با سه مفصل ارائه شده است. در مدل مورد استفاده، اثر فعالسازی همزمان عضلات آگونیست و آنتاگونیست مفصل مچ دست با استفاده از مکانیزم فریز سازی لحاظ شده است. با الهام از عملکرد سیستم اعصاب مرکزی در کسب مهارتهای حرکتی، راهکار کنترلی ارئه شده مبتنی بر یکی از الگوریتم های یادگیری تقویتی توسع...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده فنی 1391

یادگیری تقویتی با مسئله یادگیری عامل هوشمند برای انتخاب اعمال به منظور بیشینه کردن کارایی عامل سروکار دارد. استفاده از مهارت ها در یادگیری تقویتی، سبب سرعت بخشیدن به کارکرد عامل می شود. یافتن اهداف میانی و ایجاد مهارت برای دست یابی به آنها، مسئله ای کلیدی در کشف خودکار مهارت می باشد. با کشف اهداف میانی و تعیین تابع سیاست دست یابی به آنها، عامل قادر به اکتشاف موثرتر ویادگیری سریع تر در کارهای دی...

به‌دلیل عدم امکان پیش‌بینی همه وضعیت‌های ممکن برای عامل‌ها در یک سیستم چندعامله‌ی پویا و گسترده، روش‌های یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عامل‌ها می‌باشد. فوتبال شبیه‌سازی شده ربات‌ها یک مسئله شناخته‌شده برای ارزیابی الگوریتم‌های یادگیری ماشین روی سیستم‌های چندعامله است. در این مقاله الگوریتم یادگیری کیو ـ وی (یکی از الگوریتم‌های معروف یادگیری تقویتی) جهت بهبود عملکرد حمله در تیم رب...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده مهندسی 1393

طراحی کنترل کننده های فازی با استفاده از الگوریتم های تکاملی و یادگیری تقویتی q - فازی موضوعی است که در کنترل ربات ها نقش مهمی ایفا می کند. در این پایان نامه سه روش پیشنهادی برای حل مسائل کنترلی فازی تقویتی ارائه گردیده است و هر سه این روش ها روی یک مسئله فازی تقویتی به نام، ماشین عقب رونده به سمت بالا، شبیه سازی شده اند و همه ی این روش ها از ترکیب یادگیری q-فازی با یک الگوریتم بهینه سازی ایجاد...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1390

hiv ویروسی است که با مختل کردن عملکرد و از بین بردن نوع خاصی از سلول های ایمنی بدن به نام t-cd4 منجر به نقص دستگاه ایمنی بدن انسان می شود. این ویروس با از بین بردن این گونه از سلول ها، باعث ایجاد بیماری ایدز (نقص ایمنی اکتسابی) می شود. امروزه پیشرفت های قابل توجهی در داروهای مورد استفاده در درمان بیماران مبتلا به عفونت hiv پدیدار گشته است که سبب بهبود کیفیت زندگی و افزایش طول عمر بیماران شده اس...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده کامپیوتر و فناوری اطلاعات 1393

یادگیری تقویتی یکی از حوزه های یادگیری ماشین است که هدف آن بهبود رفتار عامل بر اساس سیگنال های تقویتی است که از محیط دریافت می کند. مشکل اینجاست که در بسیاری از کاربردهای واقعی، پاداش محیط با تاخیر بسیار زیادی به عامل داده می شود. مشکل دیگر این است که تا زمانی که عامل به یک سطح قابل قبول از یادگیری برسد، تمام حرکات آن تصادفی خواهد بود. ضمناً با پیچیده تر شدن محیط، تعداد وضعیت های مورد اکتشاف و پ...

ژورنال: :مکانیک سازه ها و شاره ها 2013
بهروز رئیسی شاپور گلبهار حقیقی علی اکبر صفوی

در این تحقیق، روشی جدید مبتنی بر تکنیکهای یادگیری تقویتی با تکیه بر روش تفاوت زمانی صفر در مبحث یادگیری تقویتی، برای حذف نویز صوتی به صورت فعال در سیگنالهای باند باریک ارائه گردیده است. برای پیاده سازی این روش مبتنی بر فیدبک، اطلاعاتی از دینامیک مسیر اولیه و ثانویه لازم نمی باشد و در نتیجه این روش نسبت به تغییر این پارامترها به صورت مقاوم عمل می نماید. حجم بسیار کم محاسبات ریاضی و حافظه بسیار ا...

ژورنال: :مهندسی برق دانشگاه تبریز 0
عادل اکبری مجد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حسین شایقی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق حمید محمدنژاد دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق عبداله یونسی دانشگاه محقق اردبیلی - دانشکده فنی و مهندسی - گروه مهندسی برق

هدف از این مقاله استفاده از یادگیری تقویتی برای طراحی کنترل کننده های pid و smes مقاوم و تطبیقی برای کنترل بار فرکانسی در یک سیستم قدرت دو ناحیه ای حرارتی است. ابتدا تنظیم پارامترهای کنترل کننده های pid و smes به صورت یک مسئله بهینه سازی مدل شده توسط الگوریتم تدریس - یادگیری اصلاح شده حل می شود. سپس عملکرد هم زمان آن ها با استفاده از الگوریتم پیشنهادی مبتنی بر یادگیری تقویتی بهینه می گردد. کنتر...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی و کامپیوتر 1390

سیستم های چندعامله ((mas راه حلی برای مسائل مطرح شده امروزه است که ویژگی هایی مانند توزیع شدگی، پویایی ، تطبیق پذیری، تنومندی، کارایی و قابلیت استفاده مجدد را فراهم می کند. از آنجا که محیط معمولا به اندازه کافی هوشمند نیست تا عاملهای انفرادی را در یک تیم همکارانه تشخیص صلاحیت دهد و سیگنال تقویتی اسکالر منفرد، تنها بازخورد قابل اطمینان است که تیم عامل های یادگیر دریافت می کند، انتساب امتیاز بی...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید